موتورهای جستجو

Download Report

Transcript موتورهای جستجو

Slide 1

‫به نام حضرت دوست‬

‫موتور های جستجو‬
‫اسماعیل یلمه ها‬
‫مجتمع آموزش عالی فنی ومهندس ی قوچان‬
‫زمستان ‪1389‬‬


Slide 2

‫مقدمه‬

‫‪1‬‬

‫آخرین آمار ها (‪ )2009‬حاکی از وجود ‪ 234‬میلیون وب سایت بر روی وب است‪.‬‬

‫‪2‬‬

‫تعداد وب سایت های افزوده شده در سال ‪ 47 ، 2009‬میلیون وب سایت است‪.‬‬

‫‪3‬‬

‫برای دست رس ی به اطالعات نیاز به دسته بندی خاص مطالب است‪.‬‬

‫‪4‬‬

‫با وجود این که دانش هر سال دو برابر می شود چگونه می توانیم دسته بندی کنیم؟‬

‫استفاده از موتور های جستجو راه حل موضوع‬


Slide 3

‫تاریخچه موتور های جستجو‬
‫اولین موتور جتسجو به نام ”وندکس“ در اوایل دهه ی ‪ 90‬معرفی شد‪.‬‬
‫اولین موتور جستجوی محبوب به نام “لیکوس (‪ ”)lycos‬توسط دانشگاه کارنگی راه اندازی شد‪.‬‬
‫آلتا ویستا دومین موتور جستجوی محبوب بود‪.‬‬
‫در پایان دهه ی ‪ 90‬موتور جستجوی یاهو به عنوان محبوب ترین موتور جستجوی شناخته شد‪.‬‬
‫گوگل از سال ‪ 2001‬یکه تاز موتور های عرصه وب شد‪.‬‬


Slide 4

‫مختصری در مورد گوگل‬

‫کلمه ‪ Google‬از لغت ‪ googol‬گرفته شده که به معنای عدد یک با صد صفر در جلوی آن است‪.‬‬

‫گوگل دلیل استفاده از این کلمه را تعداد بی نهایت و نامحدود اطالعات موجود در دنیای اینترنت عنوان‬
‫کرده و هدف خود را در اختیار قرار دادن این حجم از اطالعات برای کاربران عنوان کرده است‪.‬‬

‫لری پیچ و سرگئی برین موسسین این وب سایت هستند (در سن حدود ‪ 23‬سالگی)‬

‫شروع طوفانی گوگل با نو آوری جدیدی جهت دنبال کردن لینک های مرتبط به هم‬


Slide 5

‫مختصری در مورد گوگل‬

‫جدی گرفته نشده گوگل و طرد شدن توسط بسیاری از سرمایه گذاران‬

‫راه اندازی شرکت گوگل با سرمایه ای بالغ بر یک میلیون دالر‬

‫در سال ‪(1998‬حدود دو سال پس از راه اندازی گوگل) نشریه ‪ pc world‬گوگل را بین ‪ 100‬سایت برتر‬
‫معرفی کرد‪.‬‬

‫راه اندازی سرویس های تبلیغات کلیکی ‪ ،‬تحت پوشش قرار گرفتن ‪ 26‬زبان ‪ ،‬جستجوی تصاویر ‪ ،‬میزبان‬
‫وبالگ ‪ ،‬صندوق پست الکترونیکی ‪google earth ،‬و ‪...‬‬


Slide 6

‫انواع موتور های‬
‫جستجو‬
‫تکمیل دستی‬
‫•فهرست های تکمیل دستی‬
‫فهرست هایی هستند که‬
‫مدیران می توانند سایت خود‬
‫را در آن ثبت نمایند‪.‬‬
‫•در هنگام جستجو در این‬
‫جستجو گر های تنها جستجو‬
‫در بین این فهرست و‬
‫توضیحاتی که برای هر وب‬
‫سایت وارد شده انجام می‬
‫گیرید‪.‬‬

‫پیمایش ی‬

‫‪Dmoz‬‬
‫‪Excite‬‬
‫‪Yellowpage‬‬

‫به طور خود کار سایت هایی‬
‫را که در فهرستشان قرار‬
‫گرفته را بازیابی می کنند و‬
‫تمام یا برخی مطالب آنها را‬
‫بسته به نوع جستجو گر‬
‫برداشته و پایگاه داده خود‬
‫قرار می دهند‪ .‬که به دو نوع‬
‫زیر تقسیم بندی می شوند‪:‬‬
‫‪Searchable .1‬‬
‫‪subject index‬‬
‫‪full text search .2‬‬
‫‪engine‬‬


Slide 7

‫اجزاء اصلی یک موتور جستجوی پیمایش ی‬

‫‪Ranker‬‬

‫توسط الگوریتم خاص ی‬
‫اقدام به رتبه بندی‬
‫مطالب می کند‪.‬‬

‫‪Indexer‬‬

‫اطالعات دریافتی پس از‬
‫تجزیه و تحلیل تقسیم‬
‫بندی می شود‪.‬‬

‫‪crawler‬‬

‫یک ربات خزنده ‪ ،‬که‬
‫مامور یافتن صفحات‬
‫اینترنتی است‪.‬‬


Slide 8

‫یک نکته بسیار مهم‬
‫مهم ترین موارد مورد توجه موتور های جستجو جهت ارائه یک نتیجه‬
‫مناسب برای جستجو عبارتند از‪:‬‬
‫‪ 1‬مولفه متن‬
‫‪2‬‬

‫مولفه لینک‬

‫‪3‬‬

‫مولفه محبوبیت‬

‫‪5‬‬

‫نتیاج دیگر موتور های جستجو‬


Slide 9

‫مولفه متن‬

‫‪‬‬
‫‪‬‬

‫‪‬‬
‫‪‬‬
‫‪‬‬

‫گوگل توجه زیادی به متن دارد به طوری که اگر سایت شما رتبه‬
‫‪ 10‬را نیز دارا باشد اما متن مورد نظر در وب سایت شما نباشد‬
‫وب سایت شما حتی در صفحه آخر نیز ظاهر نمی شود‪.‬‬
‫وب سایت هایی از اهمیت بیشتری برخوردارند که بر روی‬
‫موضوعی خاص کار می کنند‪.‬‬
‫ویرایش صحیح مطالب‬
‫افزدون کلمات کلیدی مناسب‬
‫(کلمات کلیدی‪ :‬کلماتی که موضوع اصلی مطلب را می رسانند)‬
‫تمرکز بر روی اضافه کردن مطالب جدید‬
‫‪ ‬ترغیب بازید کننده به بازدید بیشتر از سایت شما(مربوط به مولفه محبوبیت)‬

‫‪‬مطالب جدید جایگاه بهتر ی در جستجو ها دارند‪.‬‬


Slide 10

‫مولفه متن‬
‫از این موارد بپرهیزید‬
‫مطالب خیلی ریز‬
‫صفحات سنگین تر از ‪ 150‬کیلو‬
‫بایت(بدون احتساب تصاویر و فایل‬
‫های ضمیمه شده)‬

‫هشدار‬
‫عنوان بزرگ تر از ‪70‬‬
‫کاراکتر‬

‫تکرار کلمات‬
‫کلیدی در یک‬
‫صفحه‬


Slide 11

‫مولفه متن‬

‫پیشنهاداتی برای حرفه ای ها‬
‫‪1‬‬

‫‪2‬‬

‫‪3‬‬

‫یافتن کلمات کلیدی در متون‪:‬‬

‫اطالع یافتن از محبوبیت کلمات‪:‬‬

‫بخش های مهم صفحات‪:‬‬

‫برای یافتن کلمات کلیدی‬
‫در متون می توانید از‬
‫ابزار های سایت زیر‬
‫استفاده کنید‪:‬‬

‫برای یافتن کلمات کلیدی‬
‫مشابه با کلمه ای می‬
‫توانید از ابزارهای سایت‬
‫زیر استفاده کنید‪:‬‬

‫مطالبی که در بین تگ های‬
‫زیر قرار می گیرند از نظر‬
‫گوگل از اهمیت بیشتری‬
‫برخوردارند‪:‬‬

‫‪Keywordtool.mobile‬‬
‫‪press.org‬‬

‫‪Adwords.google.com‬‬
‫‪/select/keyword tool‬‬
‫‪external‬‬

‫‪، header ، Bold‬‬
‫‪underline ، italic‬و ‪...‬‬


Slide 12

‫مولفه لینک‬

‫‪ ‬فرمول زیر معرف الگوریتم خاص ی است که عنوان می شود گوگل‬
‫از آن برای تعیین رتبه سایت با استفاده از لینک ها می نماید‪:‬‬

‫• )‪ : F(g‬ضریبی که معموال برابر ‪ 0.85‬در نظر گرفته می شود‪.‬‬
‫• )‪ : Pr(t‬رتبه سایتی که به شما لینک داده است‪.‬‬
‫• )‪ : C(t‬وزن لینکی که به شما داده شده است‪.‬‬
‫‪ ‬مکان لینک در صفحه‬
‫‪ ‬تعداد کلمات کلیدی در متن لینک‬


Slide 13

‫مولفه لینک‬
‫‪ ‬لینک ها همانند رای هستند یعنی هر چقدر لینک بیشتری توسط سایت‬
‫های مشهور تری به شما داده شده باشد یعنی محبوب ترید پس باید رتبه‬
‫بهتری هم در گوگل داشته باشید‪.‬‬
‫‪ ‬لینک ها به دو دسته تقسیم می شوند‪:‬‬
‫‪ ‬لینک های ورودی‬
‫لینک هایی که از سایت های دیگر به شما می شود‪.‬‬
‫باعث افزایش رتبه شما می شود‪.‬‬
‫‪ ‬لینک های خروجی‬
‫لینک هایی که از سایت شما به سایت های دیگر می شود‪.‬‬
‫باعث کاهش رتبه شما می شود‪.‬‬

‫نکته‪ :‬لینک های دو طرفه حالتی خنثی متمایل به افزایش وب سایت شما‬
‫را به دنبال دارد‪.‬‬


Slide 14

‫مولفه لینک‬

‫شرایط تبادل لینک موثر تر‬

‫تبادل لینک با سایت های با رتبه برابر یا باال تر‬

‫تبادل لینک با سایت های هم موضوع‬

‫قرار دادن کلمات کلیدی مناسب در متن لینک‬

‫استفاده از جمله ی اسمیه برای متن لینک‬

‫رتبه سایت‬

‫موضوع سایت‬

‫متن لینک‬
‫متن لینک‬


Slide 15

‫مولفه لینک‬

‫لینک هایی با متن‬
‫اینجا را کلیک کنید‪.‬‬

‫لینک به سایت هایی که از مصادیق‬
‫سایت های ‪spam‬هستند‪.‬‬

‫از این موارد بپرهیزید‬

‫هشدار‬
‫لینک هایی با عمق بیش تر از‬
‫‪ 4‬قسمت‬
‫‪Iran.ir/old/news/‬‬
‫‪sport/football/alik‬‬
‫‪arimi‬‬


Slide 16

‫مولفه لینک‬
‫پیشنهاداتی برای حرفه ای ها‬
‫‪1‬‬

‫‪2‬‬

‫‪3‬‬

‫ثبت وب سایت در دایرکتوری های با‬
‫رتبه باال‬

‫استفاده از خاصیت‬
‫”‪rel=“nofollow‬‬

‫استفاده از ‪breadcrumb‬‬

‫استفاده از دایرکتور های موضوعی با رتبه‬
‫باال که با هدف های دسترس ی آسان برای‬
‫کاربران و موتور های جستجو راه اندازی‬
‫شده اند‪.‬‬

‫با این خاصیت به موتور جستجو می‬
‫گویید که لینک شما را به مقصد‬
‫دنبال نکند‪ .‬بدین گونه سایت شما از‬
‫بسیاری از مضرات لینک خارجی در‬
‫امان خواهد بود‪.‬‬
‫”‪‫درگاه >”‪rel=“nofollow‬‬
‫>‪
‫‪Dmoz.ir‬‬
‫‪Digg.com‬‬

‫این سیستم که در یک خط مسیر‬
‫صفحه ی فعلی کاربر را به او نشان‬
‫می دهد‪ .‬کاربر به راحتی می تواند به‬
‫صفحات قبلی و اصلی مراجعه نماید‪.‬‬


Slide 17

‫مولفه محبوبیت‬

‫• مهمترین مولفه است چرا که تمام تالش یک وب سایت حذف‬
‫مخاطب و نگه داری آن است‪.‬‬
‫• اگر یک وب سایت با ذائقه مخاطب همسان نباشد به زودی‬
‫توسط کاربر کنار گذاشته می شود‪.‬‬


Slide 18

‫مولفه محبوبیت‬

‫مهمترین فاکتور ها در محبوبیت سایت‪:‬‬
‫‪1‬‬

‫تمرکز بر موضوعی خاص‬

‫‪2‬‬

‫جلوه ظاهری متناسب با موضوع‬

‫‪3‬‬

‫آرایش مطالب‬

‫‪4‬‬

‫سادگی چیدمان لینک ها و سلسه مراتب وب سایت‬


Slide 19

‫چالش در نتایج موتور های جستجو‬
‫موتورهای جستجو سعی دارند تا با در پیش گرفتن راه کارهای مختلف اقدام به ارائه بهترین‬
‫نتایج جستجو نمایند اما می توان با در پیش گرفتن شیوه های زیر وب سایت را در بین این نتایج‬
‫قرار داد هر چند شایستگی آن را نداشته باشد‪.‬‬

‫تبادل لینک با‬
‫سایت های‬
‫مختلف‬
‫استفاده از کلمات‬
‫کلیدی و متاتگ های‬
‫مشهور و غیر اخالقی‬

‫دستکاری فایل ‪Robots.txt‬‬
‫به صور زیر‪:‬‬
‫*‪User-agent:‬‬
‫‪Crawl-delay:10‬‬

‫استفاده از ربات‬
‫های افزایش‬
‫دهنده آمار سایت‬
‫در ‪alexa‬‬

‫استفاده از‬
‫‪MiniSite‬‬
‫ها‬


Slide 20

‫مقایسه موتور های جستجو گر‬

‫‪Google 57.7%‬‬
‫‪Yahoo 17.2%‬‬

‫‪Google 71.59%‬‬

‫سال‪2007‬‬

‫سال‪2010‬‬

‫‪Microsoft site(msn) 12%‬‬

‫‪Yahoo 14.28%‬‬

‫‪Microsoft site(bing) 9.87%‬‬

‫سهم هر یک از موتور های جستجو از‬
‫جستجو های انجام شده‬


Slide 21

‫انتقاداتی از موتور های جستجو‬
‫انتقادات‬
‫•سیستم رتبه بندی باعث‬
‫می شود تا سایت های‬
‫بسیاری بر اساس سلیقه‬
‫عامه کاربران فهرست‬
‫شوند به براسای محتوای‬
‫آنها‬

‫نفوذ موتور های جستجو‬
‫به حیطه خصوص ی‬
‫کاربران و جمع آوری‬
‫اطالعات آنها و امکان بهره‬
‫وری از آنها به شدت مورد‬
‫انتقاد است‪.‬‬


Slide 22

‫از حسن توجه شما متشکریم‪.‬‬